首款KRAS抑制剂临床数据遭FDA质疑,试验中统计学陷阱难避免?
1
Amgen非小细胞肺癌
2
Lumakras上市后
研究遭到FDA质疑
作为验证sotorasib临床获益的上市后研究(PMR)的一部分,Amgen进行了开放标签临床试验CodeBreaK 200。试验将患者以1:1的比例随机分配接受单药口服 sotorasib或单药静脉注射多西紫杉醇,主要终点是无进展生存期(PFS)。
10月5日,FDA肿瘤药物咨询委员会讨论把Lumakras的加速批准转变为全面批准的可能性。但在正式讨论之前,FDA发布了一份文件,表达了他们对CodeBreaK 200临床试验中的统计学“系统性偏差”(systematic bias)问题的关注。
3
试验设计与数据分析
对临床结论的重要性
针对Amgen数据分析和结论中存在的统计学漏洞,FDA对CodeBreaK 200的PFS数据使用了区间截尾(interval censoring)的方法重新进行了评估。Interval censoring是主要分析(primary analysis)的一种替代方式。它假设对于在评估间隔结束时评估为进展性疾病的任何患者,他们的PFS事件可能发生在分析间隔期间的任何时间。对于已经发生PFS事件的个体,事件所发生的时间被认为是区间的左端点。也就是说,在6周一次的检测中,如果第6周零一天的PFS事件被检测到(只能在第12周被检测到),那么这个PFS在interval censoring中将被视为6周,而不是primary censoring中的第12周。
FDA通过interval censoring方法得到的sotorasib组的中位PFS为4.2个月,而多西紫杉醇组为4.3个月。同Amgen得出的结论相反。这更加剧了FDA对于sotorasib对PFS增益结论有效性的怀疑。鉴于试验设计和分析问题,FDA担心CodeBreaK 200可能不算是一项充分且得到良好控制的试验,因此可能无法提供实质性证据来支持sotorasib有效性的主张。
Amgen在CodeBreaK 200中犯下的统计学错误,实际上可以类比于DoE(Design of Experiments)实施之前,没有提前搞清楚信噪比(signal-to-noise)就盲目开始实验的问题。
在DoE中,提前了解信噪比的意义在于帮助研究人员更好地规划和执行实验,确保实验结果的可信度和可重复性。高信噪比通常表示噪声与信号相比相对较小,噪声对结论造成的影响也较小。了解这一点,可以提高实验结果的可靠性和稳定性。如果信噪比低,那么实验结果可能受到随机误差的干扰,结果可能不稳定、难以复制。了解信噪比还有助于确定需要多大的样本,以及是否需要进行多次实验重复,以获得具有统计显著性的结果。
在Amgen的试验中,由于测量方法(过长的取样间隔)本身固有的偏差,可能会对结论的可靠性和有效性带来挑战。如果能够提前预测到这个问题,或许Amgen应该将每六个星期测量一次的间隔,缩短到每两个星期一次,而不是仅仅依靠p-value来得出结论。毕竟提高测量频率所带来的成本增加,要远远小于被FDA质疑临床试验结论所造成的可能后果。
专栏作者
哥哈骎
南开大学本科、硕士,德国比勒菲尔德大学博士。多肽化学、多肽API GMP生产专家、欧洲制药公司首席科学家;
拥有Lean Six Sigma黑带认证;
著有专著《Side Reactions in Peptide Synthesis》。
抗耐药结核战役(下):战争从未熄火,硝烟下的舒达吡啶或带来希望
从“老鼠药”逆袭成“抗凝传奇”:华法林的前世今生